Количественият магазин — Лабораторна конвергенция на AI
Грант Стенгер е основен изпълнителен шеф на Kinetic. Ричард Дюи е ръководещ сътрудник на Revenant Ventures и основен изпълнителен шеф на Allometry Labs.
Преди съвсем тъкмо една година DeepSeek беше пуснат с огромна фанфара по целия свят. Признат, само че ненапълно подценяван, беше фактът, че LLM с отворена тежест не идва от американска лаборатория за изкуствен интелект или интернет колос.
DeepSeek е благосъстоятелност и се финансира от High-Flyer, основан в Ханджоу количествен хедж фонд, който съгласно известията е построил портфолио от към 14 милиарда $, употребявайки модели за търговия, ръководени от изкуствен интелект, преди да реши да се обърне своите проучвания за „ гонене на AGI “ през 2023 година
Защо китайски количествен магазин стои зад един от най-силните LLM с отворено тегло в света? Оказва се, че актуалните количествени вложения и граничните лаборатории за изкуствен интелект се събират на една и съща институционална машина: широкомащабни системи за образование, прикрепени към балансите.
Едният усъвършенства приходите от търговия, до момента в който другият усъвършенства приходите от реклами или абонаменти. Под капака те споделят конвейер – данни, модел, ограничавания, осъществяване, противоположна връзка – и от ден на ден набор от гении, хардуерен стек и строги IP правила.
Това не значи, че лабораториите за изкуствен интелект се трансформират в хедж фондове; по-тясното изказване е, че машината - данни, модели, ограничавания, внедряване, противоположна връзка - се сближава. Ето малко изложение на това по какъв начин, къде и за какво кванти и лабораториите за изкуствен интелект от ден на ден се отразяват взаимно и какво може да значи това.
Количественият магазин като лаборатория за изкуствен интелект — и назад
Влезте в съвременен последователен магазин в Ню Йорк, Лондон или Шанхай и няма да видите доста от остарелия Уолстрийт. Без повече цветни якета, без крясъци. Сега всичко е ризи за хакатон и механично дрънкане на клавиатури. Всъщност, в случай че изключите четвърт циповете и Мат Ливайн за NeurIPS swag и Dwarkesh, наподобява съвсем идентично с AI лаборатория.
Ако сте квант, ето по какъв начин наподобява конвейерът в съответни термини: вашите данни са цени отметка по отметка, актуализации на книга с поръчки, покупко-продажби, корпоративни събития, макро издания, различни данни. Вашият модел е алфа прогноза — условно систематизиране на бъдещата възвръщаемост при настоящото положение. Вашите ограничавания са създаване на портфолио, предели на риска, тавани на ливъридж, правила за ликвидност, ограничавания на мандата и неофициални правила „ не бъдете идващият Archegos “. Вашето осъществяване е логаритми, които вземат решение какви нареждания къде да се изпратят, в конкурентна среда, цялостна с други логаритми. Вашата противоположна връзка е попълнения, осъществен PnL, доклади за риска, потоци на вложители, усвоявания.
Ако сте лаборатория за изкуствен интелект: вашите данни са заимствуван уеб текст, код, книги, патентовани документи, регистрационни файлове за чат, генерирано от потребителите наличие. Вашият модел е базовият LLM — параметри, които предсказват идващия токен при последните N токена. Вашите ограничавания са RLHF, пластове за сигурност, ограничавания за контекстни прозорци, бюджети за разноски, избор на UX. Вашето осъществяване съставлява токените, излъчени поточно в прозорец за чат, API клиент или верига от принадлежности, които в последна сметка удрят вашата CRM и банкова сметка. Вашата противоположна връзка е това, което потребителите вършат: оценки, проценти на довеждане докрай, задържане, отлив, доходи, доклади на аления екип.
И в двата случая главната техническа работа в действителност е идентична. Вие приближавате латентно условно систематизиране и действате върху него при ограничавания. И в двата случая разбирате единствено дали сте добър отвън извадката - в бектестове и PnL онлайн за количества; на одобрени бенчмаркове и действителни консуматори за LLM.
Погледнато през този обектив, DeepSeek престава да бъде любознание. High-Flyer към този момент знаеше по какъв начин да построи огромни GPU клъстери и да ги държи заети; по какъв начин да почистите комплицирани, противопоставящи се данни; по какъв начин да управлявате тесни вериги за противоположна връзка сред моделите и действителния свят. Насочването на този стек към предугаждане на идващ токен вместо предугаждане на последваща цена е постепенна стъпка, а не преоткриване.
Съобщава се, че първите покупко-продажби за надълбоко образование на High-Flyer са пуснати онлайн през 2016 г.; до 2017 година по-голямата част от търговията му беше ръководена от AI. Изграждането на LLM с общо предопределение от тази позиция е просто доставка на друг артикул от същата линия.
Данните ouroboros
Първите осиновители имат тънко, само че решаващо преимущество, когато става въпрос за данни: техните модели са подготвени на нещо по-близко до главната истина — и тази съществена истина става все по-трудна за намиране.
Ранните количествени индикатори в края на 80-те и 90-те години образоват модели на пазари, доминирани от хора, търгуващи против хора. Ценовите серии отразяват трайни модели в човешкото държание, а не зоологическа градина от взаимодействащи си логаритми. Ветераните от първата квантова вълна ще ви кажат, че се чувствате като че ли научавате нещо за това по какъв начин търгуват същинските хора, а не по какъв начин се държат автоматизираните системи за търговия.
Ранните основатели на LLM имаха сходен подарък. Мрежата преди 2018 година беше объркана, само че по-голямата част от нея беше написана от хора. Извличането му ви даде език, обстоятелства, код и просвета, които идват от шумната действителност, а не от по-ранни генерации модели.
Бързо напред към днешния ден и пазарите са наситени с алгоритмични системи, реагиращи една на друга. Някои модерни сигнали са просто вериги за противоположна връзка сред моделите. Междувременно мрежата се запълва с генерирани от AI мръсотия: SEO спам, синтетични вести, шаблонни описания на артикули. Тренирайте с необработения противопожарен маркуч и рискувате да извършите еквивалента на машинно образование на фотокопиране на фотокопие.
Структурният проблем е еднакъв. Очевидните, елементарно изчерпани данни са все по-замърсени от личните дейности и от моделите на съперниците. Пределната стойност се крие във деликатното нареждане и данните за взаимоотношение, които можете да видите единствено вие.
Не всички данни са основани идентични. Quants се интересуват от интервали, в които съотношението сигнал/шум скочи - след отваряне или по време на рецесии. Лабораториите за изкуствен интелект от ден на ден се концентрират върху идентифицирането и повторното потребление на висококачествени токени и по-усъвършенствани техники за пречистване. Докладваното преимущество на DeepSeek живее тъкмо тук: дестилиране на доста по-голям модел посредством деликатно сортиране на релативно дребен набор от двойки въпроси и отговори и възобновяване на изненадващо количество продуктивност с доста по-малко образование.
Това провокира конкуренция освен за повече данни, само че и за по-високо качество на данните. Scale AI провежда всеобщо етикетиране на данни за образование на модели, като заплаща на хора да дават противоположна връзка и етикети. Reddit лицензира своя пожарен маркуч от изявления и мнения и някои наблюдаващи признават Grok на xAI за бързо наваксване, частично заради достъпа до данните на X (бивш Twitter). Във финансите същата логичност се демонстрира като предпочитание да се заплати за дълги, добре подбрани истории и набори от данни, които никой различен няма.
Чисто наблюдателни данни за цените не са задоволителни. Когато една компания фактически търгува, тя научава по какъв начин пазарът реагира на нейното влияние – къде ликвидността е действителна, къде е подправена, когато други играчи се отдръпват. Тази противоположна връзка е изключителна, обусловена от деяние информация. Междинното образование, от което генерираните изображения избират потребителите, е същата история в пиксели. Това са данни, които съществуват единствено тъй като вашата система е в цикъл - и те стават по-ценни, защото по-широката среда става все по-замърсена от модели.
Дори пластът за етикетиране на данни има количествени отпечатъци. Основателят на Scale AI, Александър Уанг, преди този момент е работил в Hudson River Trading, а създателят на Surge AI, Едуин Чен, преди този момент е правил алгоритмична търговия в Clarium Capital, хедж фонда на Peter Thiel. Родословието в действителност има смисъл. Ако идвате от свят, където преимуществото е надолу по веригата на качеството на данните и противоположната връзка, в последна сметка се изкушавате да изградите фабрика, която създава сигнала за образование преди всичко.
(версия с опция за мащабиране)
Горчивият урок идва на комерсиалната площадка
През по-голямата част от историята си количествените финанси са били рационално скептични към огромните невронни мрежи и има за какво.
Пазарите са шумни; сигналът е оскъден; режимите се сменят без предупреждение; бюджетите за инертност в HFT са ограничени; интерпретируемостта има значение. Следователно стекът по дифолт в множеството магазини беше линейни модели, деликатно следени дървета и доста ръчно направени функционалности, построени върху характерна за домейна вътрешен глас.
Този песимизъм не е неверен, тъкмо по този начин. Просто от ден на ден се лимитира до свиващ се ъгъл на бизнеса. При ултра-бързо правене на пазара вие в действителност нямате бюджет за инертност за трансформатор и доста PnL към момента идва от релативно елементарни модели. Много опити за напръскване на задълбочено образование на пазарите са умрели безшумно в пъкъла на задните проби.
Но остарялото равновесие избледнява. Най-известните „ AI-first “ магазини – G-Research, Quadrature, XTX и HRT – в този момент се показват като проучвателен къщи за машинно образование, които инцидентно се включват в пазари.
На процедура това значи ML хора с качулки, които се взират в тензорите на книгата за поръчки и вграждането на различни данни, а не иконометристи от остарялата школа, които примамват следващата t-stat от book-to-price. Възвръщаемостта на HRT стартира да притегля вниманието, до момента в който шепотните цифри на Quadrature, G-Research и други компании насълзяват очите. Старата армия се движи повече към основан на AI метод от години, само че триумфът на бунтовниците форсира този развой.
В Съединени американски щати няколко огромни систематични мениджъри и компании за проп търговия тихомълком разпростират конволюционни мрежи и трансформатори върху данни от книги с лимитирани поръчки и различни потоци от данни. Задачата е сходна на езиков модел: вземете дълга алегорична поредност от поръчки, покупко-продажби и анулирания, компресирайте я в някакво показване и прогнозирайте идващите няколко стъпки.
Хората, които се движат сред „ типичен “ и „ невронни “ екипи, са склонни да описват една и съща история. Мрежите най-много преоткриха сигналите, които остарялата линейна навалица към този момент имаше – дисбаланс в книгата за поръчки, модели на потока, явни междусекторни връзки – само че с по-голяма дарба да улавят редки резултати на взаимоотношение, по-малко ръчно инженерство на функционалности и повече главоболия по отношение на изчисленията, внедряването и интерпретируемостта.
Но в по-дълги хоризонти – минути до дни до месеци – възражението за инертност от микросекунди избледнява. Ако можете да си позволите няколко милисекунди или повече, става все по-трудно да се твърди, че ръчно направен модел с линеен фактор систематично ще победи добре подготвен модел за надълбоко образование, захранван със същите данни. Прилага се горчивият урок: общите способи, които се мащабират с данни и калкулации, в последна сметка побеждават умни хакове, характерни за домейн.
(версия с опция за мащабиране)
Ограничения и оптимизация
След това идва необработеният предиктор. Що се отнася до количествените индикатори, това е следен модел, който изхвърля прогноза за възвръщаемост, волатилност или потоци за идващия интервал. За лабораториите за изкуствен интелект това е базов LLM, подготвен за предугаждане на идващ токен.
Третата стъпка е пластът ограничавания, където се намира непропорционално огромно количество практическа стойност. Суровата алфа прогноза не е портфолио. Необработеният LLM не е артикул. Изкуството е в превръщането на шумни прогнози в дейности при разнообразни ограничавания.
Във финансите това са неща като създаване на портфейл, рискови предели, финансови и ликвидни ограничавания, регулаторни правила, мандатни ограничавания и описи „ неразрешени “. Съществуват цели кариери и учебници, с цел да припомнят на хората, че хубав предсказващ фактор може да се трансформира в извънредно портфолио с неверни ограничавания.
В AI рестриктивните мерки нормално се постановат посредством укрепване на образованието от човешка противоположна връзка, филтри за сигурност, правила за наличие, контекстен прозорец и бюджети за разноски, характерни за продукта фини настройки, табла за ръководство за оценка и доклади на аления екип.
Комисия по риска, която взема решение какъв опашен риск да толерира, наподобява доста на съвет за сигурност, решителен какъв брой риск от джейлбрейк е допустим. И двамата стоят сред моделистите и външния свят. И двамата могат да наложат несъгласие на умни хрумвания, които взривяват салдото или марката. Когато това се обърка, това води до Amaranth или Archegos във финансите – или злощастни пускания на модели като стартирането на Gemini на Гугъл през 2024 година, което провокира необятно публикувана реакция.
Изпълнение: микросекунди по отношение на токени в секунда
Изпълнението е мястото, където физиката се демонстрира. При търговията с ниска инертност живеете в микросекунди. Разполагате взаимно сървъри до машини за продан, спестявате наносекунди от мрежови скокове и броите пропуски в кеша. Въпросът не е „ можем ли да сложим по-изразителен модел? “ само че „ какъв брой мислене можем да си позволим в едноцифрени микросекунди? “
В тези режими класическите способи оцеляват, тъй като изчисленията са извънредно лимитирани, интерпретируемостта е от голяма важност, когато са на линия милиарди долари, а устойчивостта надминава трети знак след десетичната запетая на предсказваща акуратност.
ИИ лабораториите живеят с разнообразни, само че свързани ограничавания. Те мислят в токени за секунда, а не в микросекунди, само че въпреки всичко жонглират сред инертност, качество и цена. Управлявайте гигант